Pengecaman aksara optik
Pengecaman aksara optik

Pengecaman aksara optik

Pengecaman aksara optik atau pembaca aksara optik (OCR, Bahasa Inggeris: optical character recognition atau optical character reader) ialah penukaran elektronik atau mekanikal imej teks yang ditaip, ditulis tangan atau dicetak kepada teks terkod mesin, sama ada dari dokumen terimbas, foto suatu dokumen, foto pemandangan (contohnya teks pada papan tanda dan papan iklan dalam foto landskap) atau dari teks sari kata tertindih pada suatu imej (contohnya: dari siaran televisyen).[1]Luas digunakan sebagai bentuk kemasukan data dari rekod data kertas tercetak – sama ada dokumen pasport, invois, penyata bank, resit berkomputer, kad perniagaan, surat, cetakan data statik, atau mana-mana pendokumenan yang sesuai – ia merupakan kaedah yang umum dalam pendigitan teks tercetak agar ia boleh disunting secara elektronik, dicari, disimpan dengan lebih padat, dipapar pada baris, dan digunakan dalam proses mesin seperti pengkomputan kognitif, terjemahan mesin, teks-ke-tutur (tersari), data utama dan perlombongan teks. OCR ialah bidang penyelidikan dalam pengecamn corak, kecerdasan buatan dan penglihatan komputer.Versi awal perlu dilatih dengan imej setiap aksara, dan berfungsi pada satu fon pada satu masa. Sistem lanjutan berupaya menghasilkan darjah tinggi kejituan pengecaman bagi kebanyakan fon yang kini umum, dan dengan sokongan untuk pelbagai input format fail imej digital.[2] Beberapa sistem berupaya menerbit semula output terformat yang hampir dekat dengan halaman asal termasuk imej, lajur, dan komponen bukan teks yang lain.